UniScale: Optimización Unificada de Inferencia Adaptativa
UniScale unifica ruteo de modelos y escalado en prueba para optimizar calidad-coste en LLMs. Aprende cómo se adapta dinámicamente a cada solicitud.
UniScale unifica ruteo de modelos y escalado en prueba para optimizar calidad-coste en LLMs. Aprende cómo se adapta dinámicamente a cada solicitud.
Descubre ARTIST, el sistema que optimiza el razonamiento en series temporales seleccionando segmentos clave. Mejora la precisión un 6.46% con aprendizaje por refuerzo.
Descubre DistMatch, nuevo método de agrupación adaptativa que mejora la robustez de la predicción conforme secuencial ante cambios de distribución.